# -*- coding: utf-8 -*-

from lxml import etree
from lxml.html import fromstring

html1="""<div class="title">nihao
<span>wangweiya
<em>son</em></span>
<span>wangkun</span>
<span>jack</span>
</div>"""
dom=fromstring(html1)   #转换成dom

print dom.text  #   nihao

node=dom.getchildren()
for t in node:
	print t.text  #循环所有的孩子  wangweiya   wangkun  jack
	
node1=dom.getchildren()[0].text
print node1     #获得第一个孩子  wangweiya

node2=dom.getchildren()[0].getparent().text
print node2   #获得孩子的父节点的文本    nihao 

node3=dom.getchildren()[0].getnext().text
print node3   #获得dom子节点的紧邻的下一个兄弟 wangkun

node4=dom.getchildren()[2].getprevious().text
print node4   #获得dom子节点的紧邻的上一个兄弟

node5=dom.tag
print node5   #获得标签名字  div

node6=dom.attrib
print node6  #返回{'class':'title'}

node7=dom.xpath(u'//div[@class="title"]')  #返回的是list 
for t1 in node7:
	print t1.text
